自动监测不良药物事件(ADES)或反应(ADRS)目前正在从生物医学界获得重大关注。近年来,用户生成的社交媒体数据已成为这项任务的宝贵资源。神经模型对ADR检测的自动文本分类取得了令人印象深刻的性能。然而,对这些方法的培训和评估是对关于目标药物的用户生成的文本进行。在本文中,我们评估了不同药物组的最先进神经结构的鲁棒性。除了手动注释的列车集外,我们还调查了几种使用伪标记的数据的策略。在数据集外部实验中诊断了监督模型的瓶颈在故障性能方面,而额外的伪标记数据无论文本选择策略如何,都会提高整体结果。
translated by 谷歌翻译